Phương sai của tổng thể chung và phương sai mẫu Phương_sai

Trên nhiều tình huống thực tế, giá trị chính xác của phương sai của một tổng thể, ký hiệu bởi σ 2 {\displaystyle \sigma ^{2}} là không thể xác định trước được.

Phương pháp chung để ước lượng phương sai của một tổng thể (hữu hạn hoặc vô hạn) là ta sẽ lấy một mẫu hữu hạn các cá thể từ quần thể. Giả sử rằng mẫu thu được có các giá trị đo được là x 1 , … , x N {\displaystyle x_{1},\dots ,x_{N}} .

Phương sai của mẫu (gọi tắt là phương sai mẫu) ( x 1 , … , x N ) {\displaystyle (x_{1},\dots ,x_{N})} , được tính bởi:

σ ^ 2 = 1 N ∑ i = 1 N ( x i − x ¯ ) 2 , {\displaystyle {\hat {\sigma }}^{2}={\frac {1}{N}}\sum _{i=1}^{N}\left(x_{i}-{\overline {x}}\right)^{2},}

trong đó x ¯ {\displaystyle {\overline {x}}} là số bình quân số học của mẫu.

Tuy nhiên, σ 2 ^ {\displaystyle {\hat {\sigma ^{2}}}} là một ước lượng chệch (biased) của phương sai quần thể. Ước lượng sau là một ước lượng không chệch (unbiased) của phương sai quần thể:

s 2 = 1 N − 1 ∑ i = 1 N ( x i − x ¯ ) 2 , {\displaystyle s^{2}={\frac {1}{N-1}}\sum _{i=1}^{N}\left(x_{i}-{\overline {x}}\right)^{2},}

Chứng minh 1

Phần sau đây chứng minh s 2 {\displaystyle s^{2}} là một ước lượng không chệch của phương sai quần thể. Một ước lượng θ ^ {\displaystyle {\hat {\theta }}} của tham số θ {\displaystyle \theta } được gọi là ước lượng không chệch nếu E ⁡ { θ ^ } = θ {\displaystyle \operatorname {E} \{{\hat {\theta }}\}=\theta } .

Ký hiệu μ {\displaystyle \mu } và σ 2 {\displaystyle \sigma ^{2}} lần lượt là trung bình và phương sai của quần thể. Để chứng minh s 2 {\displaystyle s^{2}} là ước lượng không chệch, ta sẽ chứng minh rằng E ⁡ { s 2 } = σ 2 {\displaystyle \operatorname {E} \{s^{2}\}=\sigma ^{2}} . Ta có:

E ⁡ { s 2 } = E ⁡ { 1 n − 1 ∑ i = 1 n ( x i − x ¯ ) 2 } {\displaystyle \operatorname {E} \{s^{2}\}=\operatorname {E} \left\{{\frac {1}{n-1}}\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}\right\}} = 1 n − 1 ∑ i = 1 n E ⁡ { ( x i − x ¯ ) 2 } {\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\operatorname {E} \left\{\left(x_{i}-{\overline {x}}\right)^{2}\right\}} = 1 n − 1 ∑ i = 1 n E ⁡ { ( ( x i − μ ) − ( x ¯ − μ ) ) 2 } {\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\operatorname {E} \left\{\left((x_{i}-\mu )-({\overline {x}}-\mu )\right)^{2}\right\}} = 1 n − 1 ∑ i = 1 n { E ⁡ { ( x i − μ ) 2 } − 2 E ⁡ { ( x i − μ ) ( x ¯ − μ ) } + E ⁡ { ( x ¯ − μ ) 2 } } {\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\left\{\operatorname {E} \left\{(x_{i}-\mu )^{2}\right\}-2\operatorname {E} \left\{(x_{i}-\mu )({\overline {x}}-\mu )\right\}+\operatorname {E} \left\{({\overline {x}}-\mu )^{2}\right\}\right\}} = 1 n − 1 ∑ i = 1 n { σ 2 − 2 ( 1 n ∑ j = 1 n E ⁡ { ( x i − μ ) ( x j − μ ) } ) + 1 n 2 ∑ j = 1 n ∑ k = 1 n E ⁡ { ( x j − μ ) ( x k − μ ) } } {\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\left\{\sigma ^{2}-2\left({\frac {1}{n}}\sum _{j=1}^{n}\operatorname {E} \left\{(x_{i}-\mu )(x_{j}-\mu )\right\}\right)+{\frac {1}{n^{2}}}\sum _{j=1}^{n}\sum _{k=1}^{n}\operatorname {E} \left\{(x_{j}-\mu )(x_{k}-\mu )\right\}\right\}} = 1 n − 1 ∑ i = 1 n { σ 2 − 2 σ 2 n + σ 2 n } {\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}\left\{\sigma ^{2}-{\frac {2\sigma ^{2}}{n}}+{\frac {\sigma ^{2}}{n}}\right\}} = 1 n − 1 ∑ i = 1 n ( n − 1 ) σ 2 n {\displaystyle ={\frac {1}{n-1}}\sum _{i=1}^{n}{\frac {(n-1)\sigma ^{2}}{n}}} = ( n − 1 ) σ 2 n − 1 = σ 2 {\displaystyle ={\frac {(n-1)\sigma ^{2}}{n-1}}=\sigma ^{2}}

Chứng minh 2

Ta cũng có thể chứng minh bằng cách sau:

E [ ∑ i = 1 n ( x i − x ¯ ) 2 ] = E [ ∑ i = 1 n x i 2 ] − n E [ x ¯ 2 ] {\displaystyle E\left[\sum _{i=1}^{n}{(x_{i}-{\overline {x}})^{2}}\right]=E\left[\sum _{i=1}^{n}{x_{i}^{2}}\right]-nE[{\overline {x}}^{2}]} = n E [ x i 2 ] − 1 n E [ ( ∑ i = 1 n x i ) 2 ] {\displaystyle =nE[x_{i}^{2}]-{\frac {1}{n}}E\left[\left(\sum _{i=1}^{n}x_{i}\right)^{2}\right]} = n ( var ⁡ [ x i ] + ( E [ x i ] ) 2 ) − 1 n E [ ( ∑ i = 1 n x i ) 2 ] {\displaystyle =n(\operatorname {var} [x_{i}]+(E[x_{i}])^{2})-{\frac {1}{n}}E\left[\left(\sum _{i=1}^{n}x_{i}\right)^{2}\right]} = n σ 2 + 1 n ( n E [ x i ] ) 2 − 1 n E [ ( ∑ i = 1 n x i ) 2 ] {\displaystyle =n\sigma ^{2}+{\frac {1}{n}}(nE[x_{i}])^{2}-{\frac {1}{n}}E\left[\left(\sum _{i=1}^{n}x_{i}\right)^{2}\right]} = n σ 2 − 1 n ( E [ ( ∑ i = 1 n x i ) 2 ] − ( E [ ∑ i = 1 n x i ] ) 2 ) {\displaystyle =n\sigma ^{2}-{\frac {1}{n}}\left(E\left[\left(\sum _{i=1}^{n}x_{i}\right)^{2}\right]-\left(E\left[\sum _{i=1}^{n}x_{i}\right]\right)^{2}\right)} = n σ 2 − 1 n ( var ⁡ [ ∑ i = 1 n x i ] ) = n σ 2 − 1 n ( n σ 2 ) = ( n − 1 ) σ 2 . {\displaystyle =n\sigma ^{2}-{\frac {1}{n}}\left(\operatorname {var} \left[\sum _{i=1}^{n}x_{i}\right]\right)=n\sigma ^{2}-{\frac {1}{n}}(n\sigma ^{2})=(n-1)\sigma ^{2}.}